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요 약 


최 근 의 내 용 기반 영상 검색 시 스 템 은 한정된 수 의 영 상 을 저장해 놓은 단 일 의 서 버 를 이 용 하 고 있다. 
이로 인해 웹 상의 다양한 영 상 을 원하는 웹 사 용 자 의 요 구 를 만 족 시키지 못하고 있다. 수많은 웹 영 상 올 
대 상 으로 하는 내 용 기반 영상 검색 시 스 템 은 무 엇 보다도 실 시 간 에 기 반 을 두어야 한다. 이를 구 현 하기 위해 
서는 영상 수 집 과 특징 추 출 에 걸리는 많은 소모 시간 문 제 가 해 결 되어야 한다. 최근, 고 속 의 데이터 처 리 를 
목 적 으로 부 하 분산 『( 클 러 스 터 가 개 발 되고 있다. 본 논 문 에서는 많은 시 간 을 요 하 는 영상 수 집 과 특징 추출 
작 업 을 부 하 분산 『( 클 러 스 터 의 종속 컴 퓨 터 돌 에 분 배 함으로써 전체 검색 시 간 을 감 소 시 켰 으 며 , 이를 통해 
실시간 웹 영상 검 색 의 가 능 성 을 발 견 할 수 있었다. 
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1. 서 론 에 이르고 웹 문 서 에 포 함 되어 있는 이미지 수 의 중 
가는 웹 사이트 중 가 율 의 몇 십 배가 넘는다. 
반도체 기 술 의 발 전 으 로 (『0 의 처리 속 도 는 지난 웹 사 용 자 나 웹 을 이용한 정보 처 리 의 증 가 율 이 


수 십 년간 10 빼 정 도 의 개 선 을 이루었고 광통신 기술 하드웨어 기 술 의 발달 속 도 에 비해 결코 뒤지지 않는 
의 발 전 으로 통 신 망 의 속 도 는 10" 배 이 상 으로 개 선 되 것이다. 따라서 여전히 (#1 의 처리 속 도 와 통 신 망 의 


었 다 [11. 속 도 는 소프트웨어 개 발 의 걸 림 돌 이 되고 있다. 
그러나, 웹 사 용 자 의 증 가 는 지난 몇 년간 10" 배 물론, 처리 시간적 중 요 도 가 높은 핵 발 전 과 프로 
준회원, 경 상 대 학교 강사 세스 제어 등과 같은 응용 분 야 에 사 용 되 는 컴퓨터 
정 희 원, 시 스 템 에서 수 행 되는 많은 태 스 크 들은 분산 처 리 되 


정회원, 경 상 대 학교 컴 퓨 터 과 학과 교수, 컴퓨터 정보 
통신 연구원 어 지고 엄격한 실시간 제 한 을 갖고 있으며 그에 관 
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련 한 연 구 들이 여러 방 면 으로 이 루 어 지 고 있 다 [21. 

기 존 의 웹 영상 검색 분 야 에서는 대부분 서 버 에 
저장된 영상 데 이 터 베 이 스 롤 이용한 영 상 검 색 을 지 
원 하 고 있 다 [3]. 그러나 한정된 수 의 영 상 으 로 는 웹 
사 용 자 의 요 구 를 만 족 시키기 어렵다. 따라서 다 양 하 
고 수많은 영 상 을 웹 사 이 트 로부터 직접 제 공 할 필요 
가 있다. 그러나 웹 문 서 에 포 함 되어 있는 이 미 지 의 
수가 그 수 를 짐작할 수도 없을 정도로 많 은 데 다 이 
미 지 의 종 류 나 크기, 저장된 위 치 도 다 제 각 각 이기 
때문에 실 시 간 으로 각 사 이 트 에 접 속 하 여 검 색 을 하 
기 에 는 너무나 팝 은 처리 시 간 이 요 구 되어 근본적인 
제 약 이 따른다. 

따라서 본 논 문 에서는 실시간 웹 영상 검 색 을 위 
해 2 클 러 스 터 를 이용한 분산 처 리 를 행 하 고 자 한 
다. 동일한 성 능 과 사 양 을 가진 『<: 들 을 서로 연 결 하 
여 그 중 하 나 를 마스터 노 드 로 하고 나 머 지 는 슬레 
이브 노 드 로 하여 마스터 노 드 의 지 시 하 에 각 각 의 
슬레이브 노 드 가 독 립 적 으로 웹 사 이 트 에 접 속 하 여 
이 미 지 를 저 장 하고 저 장 한 이 미 지 의 특 징 을 추 출 하 
여 마 스 터 에 넘기면 마 스 터 에 서 유사 영상 검 색 올 
하도록 하여 전체적인 처 리 시 간 을 최대한 줄 임 으로 
써 실시간 영상 검 색 이 이 루 어 지 도록 하였다. 


2. 『 ㅇ 6 클 러 스 터 와 영 상 검 색 에 관한 고찰 


2.1 『 ㅇ 클러스터 


(#20 의 성 능 이 아무리 개 선 된 다 하 여 도 실 제 적 인 
시 뮬 레 이 션 에 필요한 계산 용 량 을 지원해 줄 수 없으 
므로 이에 대한 대 웅 책 으로 다 수 의 저가 2( 를 병렬 
로 연 결 하여 계 산 을 분 할 하여 실 행 시켜서 대단위 계 
산 올 수 행 하려는 연 구 가 시 도 되었다. 클 러 스 트 링 올 
위한 471 프 로 그 램 으 로 는 범 용 의 병렬 환 경 을 제공 
하는 274(2223116 170421 5430101068) 과 [1(54655886 
2661068 1016 다 806) 가 발 표 되 었고, 계속 개 선 되고 있 
다 [4]. 

여 러 대 의 컴 퓨 터 를 서로 연 결 하여 마치 하 나 의 컴 
퓨 터 처 럼 사 용 하는 것을 클 러 스 터 라고 하며 클 러 스 
터 로 연결된 컴 퓨 터 들은 서로 통 신 이 가 능 하 며 업무 
를 분 담 해 서 수 행 하게 된다. 

20 클 러 스 터 의 목 적 은 저 가 의 2( 를 다수 연 결 하 
여 슈 퍼 컴 퓨 터 의 성 능 을 초 과 하는 계산 장 비 를 구현 
하는 것이다. 현 재 의 기 술 로 슈 퍼 컴 퓨 터 가 격 의 1~ 


29% 의 자 금 으로 동등한 성 능 을 실현할 수 있다. 

초 창 기 의 클 러 스 트 링 은 주로 페 일 오 버 에 중 점 올 
두 었 지만 현 재 는 이외에도 동일한 하 나 의 작 업 을 클 
러 스 터 내 에 서 여러 대의 호 스 트 로 분 산 시키는 로드 
밸 런 싱 에 관 심 이 모 아 지고 있다. 

클 러 스 터 는 크게 부 하 분산 클 러 스 터 와 고 가 용성 
클 러 스 터 의 두 부 류 로 분 류 된 다 [561. 

부 하 분산 클 러 스 터 는 다 수 의 컴 퓨 터 가 하 나 의 프 
로 그 램 을 협 동 으로 수 행 하 여 고 성 능 의 계 산 능 력 을 
낼 수 있어 특정 분 야 에 있어서는 기존 슈 퍼 컴 퓨 터 
보다 가격대 성 능 비 가 우 수 하다는 장 점 이 있고 \66, 
0, 03[80856 동 과 같은 서 비 스 를 제 공 하기 위한 클 
러 스 터 로써 서 비 스 를 요 청 받으면 자 신 이 그 요 청 올 
처 리 하지 않고 클 러 스 터 내의 다른 컴 퓨 터 에게 서비 
스 를 제 공 하도록 함으로써 대규모 서 비 스 를 제공해 
줄 수 있다. 

고 가 용성 클 러 스 터 는 여 러 대의 컴 퓨 터 를 가지고 
있으며 그중 일 부 가 사 용 불 능 이 되었을 때 이를 극복 
하기 위 함 이 그 목 적 이다. 

이를 위해서 서 로 가 서 로 를 수시로 체 크 하 게 되며 
고장난 컴 퓨 터 를 클 러 스 터 에서 동 적 으로 제 거 하고 
해당 컴 퓨 터 가 수 행 하던 특정 작 업 을 다른 컴 퓨 터 가 
대신 수행해 주기도 한다. 또한 다시 클 러 스 터 로 합 
류 할 수 도 있다. 

낮은 가 격 과 높은 가 용 성 을 유 지 하면서 증 가 하는 
네크워크 요 청 에 효과적으로 대 응 하 기 위한 해결책 
으로 여 러 대의 호 스 트 를 묶어 네트워크 서 비 스 를 제 
공 하는 클 러 스 트 링 기 술 이 각 광 받고 있으며 계속 연 
구 되고 있 다 [7]. 

본 연 구 에서는 웹 영상 검색 과정 중 가장 많은 
처리 시 간 을 요 하 는 영 상 의 수집 및 특징 추 출 을 부 


그림 1. 웹 / 인 터넷 클러스터링 
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하 분산 클 러 스 터 를 이용해 처 리 하 고자 한다. 

웹 영 상 을 수 집 할 때 네 트 워 의 상 태 에 따라 처리 
속 도 가 많은 영 향 을 받는다. 검색 대 상 이 되는 영상 
. 의 0Ｌ 이 평균 300 개 라고 가 정 하면 하 나 의 컴퓨터 
로 처 리 하 고자 했을 때, 실제 실 험 의 경 우 ( 본 연 구 에 
서 사용한 컴 퓨 터 는 펜 티 엄 -1, 1.40412, 25641 81 
이었다) 네 트 워 의 흐 름 이 원 활 하고 영 상 의 크 기 가 
대 체 적 으로 56) 이하인 작은 영 상 의 경 우 에는 100 
여개, 네 트 워 의 흐 름 은 원 활 한 데 영 상 의 크 기 가 대용 
량 인 영 상 이 섞여 있는 경 우 에는 50 개 이하, 네 트 윗 
트 래 픽 이 혼 잡 한 경 우 라면 20 개 도 간신히 수 집 할 수 
있었다. 물론 컴퓨터 604 의 처 리 속 도 를 높이고, 메모 
리 를 확 장 하여 수 집 했을 때 수집 가능한 영상 수도 
늘 어 났 지만 10 개 에서 20 여 개 가 량 의 차 이 가 있을 뿐 
이었다. 즉 , 컴퓨터 사 양 의 확 장 만으로는 해결할 수 
가 없었다. 따라서 본 연 구 에서는 그 해 결 책 으로 부 
하 분산 2( 클 러 스 터 를 이 용 하 여 위 의 문 제 를 해결해 
보고자 한다. 고 가 의 슈 퍼 컴 퓨 터 대신 저렴한 『(: 들 을 
묶어 처 리 율 을 높 이 고 자 하는 것이다. 

본 연 구 에서 사용한 26 클 러 스 터 는 모두 4 대 로 
구 성 되어 있다. 물론, 더 많은 컴 퓨 터 를 클 러 스 터 로 
연 결 하면 더 좋은 결 과 를 얻을 수 있겠지만 연구 환 
경의 제 약 으로 4 대 로 구성된 『(: 클 러 스 터 를 사 용 하 
여 실 험 을 하였다. 


2.2 영상 검색 


영 상 을 검 색 하는 방 법 에는 텍 스 트 기반 검 색 과 내 
용 기 반 검 색 이 있다. 텍스트 기반 검 색 은 영 상 의 제 


목 이 나 영 상 의 특징 등 을 텍 스 트 로 저 장 하여 겸 색 타 ' 


는 방 법 이 고 [8], 내 용 기반 검 색 은 영 상 의 특 징 인 색 
상 , 질감, 모양, 공간적 관 계 에 근 거 하여 검 색 하는 방 
법 이 다 [8-101. 

색 상 에 근 거 하 는 방 법 으 로 는 도 미 넌 트 컬 러 를 이 
용 하 는 방 법 과 컬러 히 스 토 그 램 을 이용하는 방법, 색 
상의 이 름 을 이용하는 방법, 컬 러 - 유 도 감 각 에 대한 
방 법 이 있 으 며 [10] 질 감 에 근 거 하 는 방 법 으 로 는 공 
간 기 반 모 델 에 의한 방법, 주파수 기반 모 델 에 의한 
ㆍ 방법; 텍스쳐 시 그 네 쳐 에 의한 방 법 이 있 다 [10]. 또 
한, 모 양 에 근거한 방 법 으 로는 영상 내 에 서 색 상 이 나 
밝 기 가 급격히 변 화 하 는 부 분 을 에 지 라고 하는데 이 
러한 에 지 의 방향 성 분 들을 조 사 함으로써 물 체 의 질 
감 이나 모양, 위 치 의 유 사 성 에 대 해 저 - 판 탄 할 수 있 


고, 특 징 기반 방 법 과 모양 변형 기반 방 법 도 있다 
[1011]. 

본 논 문 에서는 두 단 계 의 검 색 과 정 을 거 치 는 데 첫 
번 째 로는 먼저, 사 용 자 의 질 의 어 를 대 상 으로 텍스트 
기반 검 색 을 하여 후 보 영 상 들 을 수 집 하고, 두 번 째 로 
는 후 보 영 상 들 중 하 나 의 질 의 영 상 을 대 상 으로 내용 
기반 검 색 을 하도록 하였다. 또한 내 용 기반 검 색 을 
위해서는 영 상 의 색 상 에 근 거 하는 컬러 히 스 토 그램 
을 적 용 하여 검 색 하였다. 


3. 실시간 분산 웹 영상 검색 시 스 템 의 구현 


본 장 에서는 26 클 러 스 터 를 이용한 내 용 기 반 의 
실시간 분산 웹 영상 검색 시 스 템 (이하 ㅁ ㅁ 0\1686 : 
표 681-017006 10161010 바 60 \66 1242086 86006?281 575- 
660) 을 설 계 하 고 구 현 한 다. 


3.1 680\165 의 설계 


80\)10658 의 전체 시스템 구 성 은 그림 2 와 같 으 며 , 
크게 사용자 인터페이스, 웹 문서 분석 및 영 상 검색, 
영상 수집 및 특 징 ` 추 출 의 세 부 분 으로 구 성 되어 있 
다. 그 중에서 가장 많은 서 간 이 소 모 되는 영상 수집 
및 특징 추출 부 분 을 3 개 의 슬레이브 노 드 들이 동시 
에 실 행 하도록 하여 전체적인 처 리 시 간 을 단 축 시키 
는 데 중 점 을 두었다. 

본 연 구 에 서 사용한 20 클 러 스 터 는 동일한 성능 
올 갖는 4 대 의 7< 를 연 결 한 부 하 분 산 클러스터 시스 
템 올 사 용 하였으며 2( 클 러 스 터 의 마스터 컴 퓨 터 는 


ㆍ 사용자 인 터 패 이 스와 웹 문서 분 석 - 및 영 상 검 색 을 


담 당 하 며 , 3 개 의 슬레이브 컴 퓨 터 는 영상 수집 및 특 
징 추 출 을 담 당 한다. 

이러한 20 클러스터 내 부 의 정보 흐 름 을 세부적 
으로 나타내면 그림 3 과 같다. 마스터 노 드 에 서는 영 


훼 86 000417@01 


그림 2. 6 ㅁ 2\\/185 의 구조 
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그림 3. 『< 클 러 스 터 의 처리 구조 


상의 0#Ｌ 을 각 각 의 슬레이브 노 드 에 전달 해 주고 
슬레이브 노 드 들 은 다른 슬레이브 노 드 와 는 상 관 없 
이 독 자 적 으로 영상 0Ｌ 에 접 속 하여 영 상 을 획 득 하 
고 특징 추 출 을 한 다음, 영상 파 일 과 영상 특징 파일 
을 디 스 크 에 저 장 하는 일 을 한다. 모든 영상 4 에 
대해 동일한 처 리 를 한 후 모든 작 업 이 끝나면 제어 
를 마스터 노 드 에 반 환 한다. 

#0\1115 의 전체 처 리 과 정은 그림 4 의 흐 름 에 따 


그림 4. 8 ㅁ \\/185 의 전체 처리 과정 


사용자 인 터 페 이 스 는 사 용 자 의 질 의 를 받고 검색 
되어진 결 과 를 출 력 해주는 일 을 한다. 본 시 스 템 의 
사용자 인 터 페 이 스 는 마스터 노 드 에서 운 용 되는 것 
으로 사 용 자 가 웹 으로 접 근 할 수 있도록 하였다. 


웹 문서 분석 및 영상 검 색 은 26: 클 러 스 터 의 마스 
터 노 드 가 담 당 하며, 이 마스터 노 드 는 사 용 자 의 입 
력 올 처 리 하여 관련 있는 웹 문 서 를 구한 뒤 , 웹 문서 
로부터 영 상 의 07Ｌ 을 추 출 하여 슬레이브 노 드 에 넘 
기고, 슬레이브 노 드 에 서 획 득 한 영 상 을 사용자 인터 
페 이 스 에 출력 해 주는 일 을 한다. 그런 다음, 사용자 
가 클 릭 한 영 상 을 질의 영 상 으로 하여 검색 대상 영 
상 들 과 의 유 사 도 를 계 산 한 후 우선 순 위 별 로 유 사 영 
상 을 출 력 해 주는 일 을 한다. 

그리고, 영상 수집 및 특징 추 출 은 26 클 러 스 터 에 
서 3 개 의 슬레이브 노 드 들이 담 당 하며 이 슬레이브 
노 드 들은 마스터 노 드 로 부터 받은 영상 0[Ｌ 을 이용 
하여 웹 으로부터 직접 영 상 을 획 득 하고 획 득 된 영상 
의 특 징 을 추 출 하는 일 을 한다. 

사 용 자 의 입 력 을 처 리 하는 20 클 러 스 터 의 작 업 을 
세 분 화 하면 웹 문서 분석 및 영 상 을 검 색 하 는 일 을 
하는 마스터 노 드 는 그림 5 와 같은 처리 과 정 을 갖는다. 

슬레이브 노 드 의 처리 과 정 은 그림 6 과 같 으 며 


그림 5. 마스터 노 드 의 처리 과정 


그림 6. 슬레이브 노 드 의 처리 과정 
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영상 수집 및 특징 추 출 은 실시간 분산 웹 영상 검색 
에서 가장 많은 처 리 시 간 이 필요한 부 분 이기 때문에 
여 러 개 의 슬레이브 노 드 에서 동시에 영 상 을 수 집 하 
도록 하였다. 


3.2 680\185 의 구현 
3.2.1 텍스트 기반 질의 

사용자 인 터 페 이 스 는 웹 에서 접 근 이 가 능 하 도 록 
트 13041 문 서 로 만들었고 검 색 하 고자 하는 영 상 의 이 
름 을 간단히 텍스트 형 태 로 입 력 할 수 있도록 하였다. 

사용자 인 터 페 이 스 를 통해 입 력 된 텍스트 기반 질 
의 를 위한 검 색 어 는 표 1 과 같은 과 정 을 통해 질 의 를 
추출한 후 이미지 파일 검색 엔 진 의 질 의 어 로 사 용 한 다. 

본 연 구 에서는 검색 엔진 “ 엠 파 스 ([1[20://368108. 
6001088.00100/968701/110386_568701.41241)” 에서 제공 
하는 “이미지 파일 검색” 엔 진 을 활 용 하여 텍스트 
기반 검 색 을 하였다. 이미지 파일 검색 엔 진 에서는 
질 의 어 를 입 력 하 면 입 력 한 질 의 어 를 포함한 영 상 의 


그림 7. 초기 사용자 인터페이스 


표 1. 질의어 추출 알고리즘 


용 리 04679( 아 27 *0467977{ 
106 의, 150; 
야 0 ㅠ ~ 60060[256]; 
0. *01; 


이 = 하 이 ( 울 아 607("@0 피 1641 83467 1“)); 


680(6076 ㄷ 이, 1, 56010); 
150460[01]= 01; 

1 짜 16(6146660++]!=10'); 
--1; 


1\111606 따 66711]!='&') ㅋ 046757++=6 따 60[ 나 +; 


10#Ｌ 을 검색해 웹 문서 형 태 로 출력 해주는 일 을 
한다. 텍스트 기반 질의 처리 과 정 은 그림 8 과 같다. 


그림 8. 텍스트 기반 질의 처리 과정 


3.2.2 웹 문서 분석 및 영상 00 분배 


웹 문서 안에는 다양한 형 태 의 27841 태 그 들이 
들 어 있다. 그 중에서 <83> 을 찾아 검색된 영상 1 
의 목 록 이 들 어 있는 .111401. 파일 리 스 트 에 대한 링 
크 목 록 파 일 을 그림 9 와 같이 만들고, <1078> 롤 찾아 
파일 종 류 별 로 영상 471Ｌ 파 일 (0617 목 록 파일, ] 마 0 
목록 파 일 ) 을 그림 10 과 같이 만든다. 

또한, 렁 크 목록 파 일 로부터 같은 과 정 을 반 복 하여 
최 종 적 인 영상 10Ｌ 파 일 을 완 성 한 다. 

각 영 상 의 47Ｌ 목록 파 일 은 영상 07Ｌ 의 중 복 을 
체 크 하여 유일한 0#Ｌ 에 대해서만 저 장 한 다. 


때 
느라 
다 
밸 
백 
{ 
] 
대 
ㅣ 


그림 9. 링크 목록 파일 


그림 10. 『 목록 파일 
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마스터 노 드 는 영 상 의 4711 목록 파 일 이 완 성 되면 
표 2 와 같은 영상 분배 알 고 리 즘 을 적 용 하여 슬 레 이 
브 노 드 들 예 그 분배 목 록 을 넘긴다. 

슬레이브 노 드 들은 각각 ㅁ 개 ( 전 체 영상 의 
수 / 슬 레 이 브 노 드 의 수 ) 씩 의 영 상 을 처 리 한다. 


표 2. 영상 분배 알고리즘 


21 868005 510; 
서비 그 011(@&2178 ㅇ @&8178?; 
제꺼 (:0001..9126(00121.(〉080454_\00 배 .10,.&040008065); 
지키 (>60101.1316(4 비 (00001. \0 브 12,&005910); 


16000710==0){ 
10『(01=111<1141001005611+ + ){ 
840 빼 ㅋ 1; 
떠 21_.5600(@&50 바 1421 그지 1'1.1808Ｌ 서 비 (:0)044_ 
\010); 
} 
10『0(1=111<11400010008;1++ ){ 
떠 21 1《1607(0110811,200*60,504021 141',11382.404021_ 
0200004.\0810,&5630; 
} 
}6196{ 


떠 21_266(@&0000605.1.010『1_411'.0,6681.121 (600454_ 
\0120,.&6680; 
100(1=0『0005-11)<114001108511+ ㅋ 1041000008){ 
한 그 00@(107@6011[1]); 
} 


121 .5600014481151200*50,5121_41'.0,6682.5101_ 
00506012\00 브 212); 
) 


3.2.3 영상 수집 및 특징 추출 

슬레이브 노 드 들은 각자 서로 다른 영상 1 ㅁ 111. 을 
기 반 으 로 영 상 올 수 집 하 고 또한 그 영 상 의 특 징 을 
추 출 하는 일 을 한다. 

영 상 을 수 집 하기 위해서는 21 17/1.0 프 로 토 콜 을 
사 용 한 다. 2117 프 로 토 콜 은 요 구 / 웅 답 방 식 으로 동 
작 하며 원하는 서 비 스 를 요 구 (31, 2051, 1847...) 
를 하면 데이터 송 수 신 을 위한 7 연 결 이 만 들 어 지 
고, 서 버 가 웅 답 을 보내어 데이터 전 송 을 끝 내 면 자 
동 적 으로 연 결 이 씀 어 지 게 된다. 표 3 과 같은 (: 언 어 
와 0101* 소 켓 을 이용한 루 틴 으 로 0 영 상 및 ]208 ㅇ 
영 상 을 획 득 할 수 있다. 혜 더 가 포 함 된 (3 영상 스 
트 럼 과 ] ㅁ 286 영상 스 트 림 의 헤 더 를 제거한 후 .0 
파 일 과 .]88( 파 일 로 저 장 한다. 영상 스 트 림 의 헤더 
제거 루 틴 은 헤 더 와 3 스트림, 혹은 ] ㅁ 08 스트 
을 구 분 하는 기준 단 어 가 버퍼 메모리 크기 내에 고 


정 적 으로 존 재 하 기 때문에 76066() 시스템 콜 이 존 


표 3. 영상 스트림 획득 루틴 


140 _19100108(0087 *2004231){ 
86746 1108161[ 차 105 다 
1105【=@601051070 ㅁ 8006(0421); 
3007=((6674 아 10_80007 *)11056[->1_8001)->56_8007; 
876 _8200『.911_180415= 6 그 찌 601'; 
50_8006.510_8001.6_8001-200 파 
976._8001.610_1001=116006(80); 


} 
5006 _10160{ 
60=500666((2 1467, 500 _5702404,0); 
00006 아 (60, (96740 5001(4007 *)@&970 80005, 
91260【(614 아 5006200(_10)); 
} 
8661080{ 


비디 0104010 용 (00084206); 

9007 타 0058, "06427 966 브 777/1.00'0", 106120110020); 
이 =6006 100; 

5600(50, 1058, 504160(00088),0); 


) 


재 하 는 루프 내 에 서 바로 행 해 지 도록 한다. 0 스트 
림 과 1006 스 트 림 의 헤더 제거 루 틴 을 표 4 와 표 
5 에 각각 나 타 내 었 다. 

일 반 적 으로 영 상 의 색 상 에 기 반 하는 검 색 에는 영 
상의 밝기 빈 도 수 를 그 래 프 로 나타낸 컬러 히 스 토 그 
램 을 사 용 한 다. 컬러 히 스 토 그 램 을 사 용 하여 영 상 의 
특 징 을 추 출 하는 이 유 는 다른 특징 추출 방 법 에 비하 
여 처리 시 간 이 빠르기 때 문 이 다. 

즉 , 웹 상의 영 상 은 글 자 를 이 미 지 로 표현한 단순 
한 영 상 에서부터 실 세 계 의 모 습 을 담은 컬 러 사 진 이 
나 화 가 들 의 작 품 에 이 르 기 까지 영 상 의 모 습 이 매우 
다 양 하며 그 크기 또한 다 양 하다. 


표 4. (차 스트림 헤더 제거 루틴 


\1116((0=160(50,641, 51260 6 바 -1, 0))>0){ 
1=0; 
(138==0){ 
1000=0; ]< ㅁ 1 1++){ 
(6[0]=='(6'@&& 611+11=='1' && 
15 바 11+21==' 패 0'){ 
188=1; 
15768; 
} 


} 
} 
107(01=11<27;11++) 
100 ㅁ 7 다 (0,"966",6 마 미 ); 
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표 5. 가 드 6 스트림 헤더 제거 루틴 
\06((0=760(50.6 바 ,51260 6 마 -1, 0))>0){ 


1= 아 
(028==0){ 
1070=0; ]< 피 )++){ 
타 (6 바 미 ==']'&&6 바 0+1]=='6'&& 
6 바 0+21=='1'@&6 마 0+3]1=='0){ 
1=9-6: 
1098=1; 
15668 
} 
} 
} 
10701=111<1011++) 
100270 타 (0,"966",6 바 40); 
) 


이러한 다양한 모 습 을 갖는 영 상 을 대 상 으로 한 
검 색 에서 모양 특 성 이나 질감 특 성 을 적 용 하기에는 
처리 시 간 이 지나치게 많이 걸리기 때문에 실시간 
검 색 을 목 적 으로 하는 본 서 스 템 에서는 다루지 않 도 
록 하였다. 

컬러 히 스 토 그 램 은 256 밝기 레 벨 을 가진 ㅁ , 6, 
8 채널 히 스 토 그 램 을 연 결 하여 일 련 의 배 열 로 배치 
한 것을 말한다. 

슬레이브 노 드 에서는 수 집 한 영 상 의 컬러 히 스 토 
그 램 을 표 6 의 루 틴 으로 구하여 영상 특징 파 일 올 
만든다. 컬러 히 스 토 그 램 은 영상 파 일 을 다운로드 받 


표 6. 컬러 히 스 토 그램 계산 루틴 
0868= ㅋ (000516060 87 *)120801106(61\101001*1111618140; 


1070=0;1<256;1++){( 
10『00=01<4;11++){ 
14(]==3) 을 라 0000); 
8186{ 
아 1=8 아 000); 
28104]0]=006 & 0 
} 


} 
} 


{17680(0212,1,01\10141*101516186111,[0); 
10560); 
// 픽 셀 당 2 ㅠ 0,6 값 출력 


107(01=01<11618161++) 
1000=01<161\100111++){ 
1=081[*08631[2]; 
@-2081[*08131[1]; 
160=081[*0368+7+][0]; 
10070 타 0\00, "0960 90 90", = 8, 60) 


1010560\1[20); 


은 다음 구 하 도록 작 성 되 어 있으며, 여기서 6 영상 
은 256 칼 라 로 구 성 되어 있기 때문에 별 도 의 파일 변 
환 작업 없이 파일 헤더 정 보 를 이 용 하 여 컬러 히 스 토 
그 램 을 구하고, ]28( 영 상 은 컬러 히 스 토 그 램 을 구 
하기 위해 먼저 880 파 일 로 변환율 하여야 한다. 

또한, 수 집 된 영 상 들의 크 기 가 다 양 하기 때문에 
컬러 허 스 토 그 램 을 구한 후 표 준 화 작 업 이 필요한데 
영 상 의 가 로 * 세 로 값 을 구 해 진 컬러 히 스 토 그램 값 
에 나누어 값 의 범 위 를 0~1 사 이 의 값 으로 표 준 화 한 
최종 특징 값 을 저 장 한 다. 


3.2.4 내 용 기반 영상 검색 

슬레이브 노 드 는 영상 수 집 과 특징 추출 작 업 이 
끝나면 결 과 를 마스터 노 드 에 전 송 한다. 

마스터 노 드 는 수 집 된 영 상 들 을 사용자 인 터 페 이 
스 에 출 력 하 고 사 용 자 가 질의 영 상 을 선 택 하면 슬레 
이브 노 드 에서 구한 영 상 의 특징 값 을 이 용 하 여 사용 
자가 선택한 질의 영 상 과 의 유 사 도 를 계 산 한다. 

질의 영 상 의 컬러 히 스 토 그램 벡 터 를 86 라 하고 
비교 영 상 의 컬러 히 스 토 그램 벡 터 를 1 라 하면 1 
번째 검색 대상 영 상 과 의 컬러 히 스 토 그램 유사도 
8\ 는 식 (1) 과 같이 구할 수 있다. 유사도 계 산 에는 
히 스 토 그 램 벡터 사 이 의 유클리드 거 리 (8614010630 
101668006) 를 적 용 하 였 다 [9]. 
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4. 실시간 분산 웹 영상 검색 결과 및 고찰 


ㅁ 0\)1016 을 사 용 하여 검색어 “ 돌 ” 과 “ 장 미 "를 입 
력 하였을 때 의 텍스트 기반 검색 결 과 를 그림 11 과 
그림 12 에 나 타 내 었다. 

텍 스 트 기반 검 색 을 시 도 하였기 때문에 영 상 의 101. 
에 “ 돌 ”, “ 장 미 "라는 글 자 가 들 어 가 거나 혹은 영 상 을 
설 명 하는 4134 텍 스 트 에 “ 돌 ” , “ 장 미 ” 라 는 글 자 가 
들어간 모든 영 상 이 검 색 되 었다. 

검색어 “ 돌 "을 입 력 하 였을 때 검색된 영상 40ＬＬ. 의 
수 는 모두 383 개 였고 실제 수 집 된 영 상 은 중 복 된 영 
상 을 제 외 하 고 128 개 이었다. 검색어 “ 장 미 "를 입력 
하였을 때 검색된 영상 00ＬＬ 의 수 는 모두 472 개 였고 
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그림 12. 텍스트 기반 검색 결 과 ( 검 색 어 : 장 미 ) 


실제 수 집 된 영 상 은 중 복 된 영 상 을 제 외 하고 147 개 
이었다. 

이들 텍스트 기반 검 색 결 과 출 력 된 영 상 들 중에서 
사 용 자 가 원하는 영 상 을 선 택 하 여 질의 영 상 으로 사 
용 한다. 그림 13 은 사 용 자 가 질의 영 상 으로 “ 돌 하 르 
방 ” 영 상 을 선 택 하였을 때 의 내 용 기반 영상 검색 결 


그림 13. 내용 기반 명상 검색 결과 1 


과 이다. 출 력 되 는 영상 중 첫 번째 영 상 이 질의 영상 
이다. 텍스트 기반 검 색 을 했을 때는 서로 연 관 성 이 
없는 영 상 들이 많 았 는데 내 용 기반 검 색 을 행한 결과 
질의 영 상 과 유사한 영 상 들이 유 사 도 순 으 로 검색된 
것을 볼 수 있다. 그림 14 는 사 용 자 가 질의 영 상 으로 
“노란 색 으 로 포 장 된 장미 꽃 다 발 ” 을 선 택 하였을 때 
의 내 용 기반 영상 검색 결 과 이다. 


개 &> 


그림 14. 내용 기반 영상 검색 결과 2 


<" 이 


5. 결 론 


본 논 문 에서 제안한 210\85 는 분산 26 클 러 스 
터 를 이 용 함 으로써 단일 컴 퓨 터 롤 이 용 하 여 웹 영상 
검 색 을 하였을 때 보다 많은 영 상 들을 보다 빠른 시 
간에 정확하게 검 색 할 수 있었다. 

웹 영 상 의 수집 과 정 은 네 트 워 의 흐 름 에 의 존 적 이 
어서 흐 름 이 원 활 할 때 와 혼 잡 할 때 의 결 과 가 상당한 
차 이 를 보였다. 

단일 컴 퓨 터 를 이 용 하 였을 경우, 1 차 문 자 기반 검 
색 결과 추 출 된 영상 0[ 의 수가 500 개 이상일 님 
실제 수 집 된 영 상 의 수 는 약 100 여 개 가 량 이었고 
러 스 터 를 이 용 하 였을 때 수 집 된 영 상 의 수 는 약 30 
여개 가 량 이였다. 

또한 처리 시 간 은 100 개 의 영 상 을 기 준 으 로 했을 
때 단일 컴 퓨 터 일 경우 약 30 초 가 량 이 걸 렸 으며 클 
러 스 터 를 이 용 하 였 을 때 약 13 초 가 량 이 소 요 되 었다. 

즉 , 1 차 검 색 결과 수 집 되 는 영 상 의 수 는 3 배 정도 
중 가 하였고 전체 처리 시 간 은 3 배 가량 감 소 함으로 
써 실시간 처 리 에 더욱 근 접 하였다. 

처 리 시 간 의 감 소 율 이 검색 영상 개 수 의 중 가 율 보 
다 낮은 것은 마스터 노 드 와 슬레이브 노드 사 이 의 
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통 신 을 위한 시 간 이 추 가 로 소 요 되었기 때 문 이 다. 


여기서 클러스터 컴 퓨 터 의 처 리 시 간이 약 13 초 인 ㆍ 


것은 실 시 간 이라 보기 어렵지만 클 러 스 터 의 수 를 늘 
리면 실시간 처 리 가 가능할 것으로 본다. 

그리고, 슬레이브 노 드 의 수 를 3 대 를 이 용 하 여 실 
시간 분산 웹 영상 검 색 을 한 결과 검 색 되 는 영 상 의 
수 는 양 적 으로 중 가 하 였지만 검색된 전 체 의 영상 
00 에는 미치지 못 하 였다. 

더욱 만족할 만한 검색 결 파 를 얻기 위해서는 향 
후 영상 0 ㅁ #Ｌ 의 슬레이브 노드 분 배 에 있어서 영상 
의 크 기 에 따른 효율적인 분 배 와 클러스터 수 의 확장 
에 따른 효율성 등에 관한 연 구 가 필 요 하 다. 
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